AI资讯新闻榜单内容搜索-Pangu Ultr

每2秒吃透一道高数大题！华为终于揭秘准万亿MoE昇腾训练系统全流程

现在，请大家一起数一下“1”、“2”。OK，短短2秒钟时间，一个准万亿MoE大模型就已经吃透如何解一道高等数学大题了！而且啊，这个大模型还是不用GPU来训练，全流程都是大写的“国产”的那种。

来自主题: AI技术研报

10673 点击 2025-05-31 14:11

Pangu Ultra MoE 是一个全流程在昇腾 NPU 上训练的准万亿 MoE 模型，此前发布了英文技术报告[1]。最近华为盘古团队发布了 Pangu Ultra MoE 模型架构与训练方法的中文技术报告，进一步披露了这个模型的细节。

来自主题: AI技术研报

10855 点击 2025-05-29 16:47